昨天簡單介紹了爬蟲,那今天就來看他可以應用在哪裡吧!
新聞標題爬蟲
範例:
import requests #匯入requests庫,用於發送HTTP請求
from bs4 import BeautifulSoup #匯入BeautifulSoup庫,用於解析HTML
# 指定目標網址
url = 'https://news.tvbs.com.tw/?gclid=CjwKCAjw9-6oBhBaEiwAHv1QvCY-QQ2rHzNGuWGwUbYz9ODropCgXVOTS8i1p0CrpEQrd-_Ad3zAwBoCqYEQAvD_BwE'
response = requests.get(url) #發送HTTP GET請求獲取網頁內容
if response.status_code == 200: #檢查請求是否成功
soup = BeautifulSoup(response.text, 'html.parser') #解析HTML內容
#在這裡可以使用BeautifulSoup方法來提取所需的信息
# 例如:擷取所有標題
titles = soup.find_all('h1')
for title in titles:
print(title.text) #印出標題
else:
print('無法造訪網頁')
首頁|TVBS新聞網
注意:爬蟲應該以合法且尊重網站使用條款和隱私政策的方式運行。未經許可的爬蟲活動可能會有法律問題或網站遭受損害喔!
今天就先學到這邊吧~
目前進度:19/30···